期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 一种基于三维空间信息的字形匹配方法
刘颖滨, 孙燕南, 荀恩东
北京大学学报(自然科学版)    2016, 52 (1): 81-88.   DOI: 10.13209/j.0479-8023.2016.016
摘要1102)   HTML    PDF(pc) (926KB)(992)    收藏

提出一种基于三维空间信息的字形匹配方法。首先将字形轮廓Bézier 曲线的二维控制点集扩展至三维, 然后为三维点集建立高斯混合模型, 最后通过最小化高斯混合模型间的欧氏距离(L2)完成匹配。采用三维空间信息可以充分利用字形所蕴含的内在约束条件。采用高斯混合模型有利于在匹配过程中保持字形整体结构特征和局部书写特征。实验结果表明, 该方法提升了汉字单笔画以及整字字形匹配的准确度和美观度, 并且具有稳定性高、扩展性强的特点。

相关文章 | 多维度评价 | 评论0
2. 面向书写教学的手写汉字图像笔画还原
荀恩东,吕晓晨,安维华,孙燕南
北京大学学报(自然科学版)   
摘要869)      PDF(pc) (607KB)(389)    收藏
为了实现智能化汉字书写教学, 提出一种手写汉字图像的笔画还原方法。首先提取手写汉字图像的骨架; 然后从知识工程的角度出发, 利用字形中稳定的拓扑信息, 消除骨架中的歧义变形; 最后利用A* 算法建立并求解手写汉字与相应模板汉字的字形相似度模型, 从而分割出手写汉字图像中的各个笔画, 并输出它们与模板汉字中各个笔画的对应关系。此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合。
相关文章 | 多维度评价 | 评论0
3. 语料库自然标注信息与中文分词应用研究
饶高琦,修驰,荀恩东
北京大学学报(自然科学版)   
摘要1021)      PDF(pc) (361KB)(362)    收藏
以中文分词为应用目标, 将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息, 分别考察了它们的分布和对大数据集上语言计算的影响。结果表明, 两者都直接或间接地表达了作者对语言的分割意志, 因而对分词具有积极的影响。通过词语抽取测试, 发现在缺乏丰富显性标注信息的文本中, 来自语言固有规律的自然标注信息对字符串有着强大的分割性能。
相关文章 | 多维度评价 | 评论0